Ralph + Codex CLI:我当老板,AI当监工,GPT-5.2当牛马的正确姿势
Ralph + Codex CLI:我当老板,AI当监工,GPT-5.2当牛马的正确姿势这两天都在研究 ralph,一个你睡觉时,都能不眠不休替你干需求、榨干任何 Coding Agent 的工具。
这两天都在研究 ralph,一个你睡觉时,都能不眠不休替你干需求、榨干任何 Coding Agent 的工具。
曾经那些将需求、设计与代码强行割裂的流水线,正在快速消融。
今天,MiniMax Agent 2.0 推出了 Desktop App,能操作本地文件、自动化网页操作。MiniMax Agent 2.0 这次更新了两个核心能力:一个是 Desktop App,一个是 Expert Agents。
当 DeepSeek 和 OpenAI 的核心突破者越来越年轻,传统的简历筛选正在失效。一位前阿里达摩院的研究员,试图用 Agent 编织一张能捕捉「下一个 Ilya」的网。
Claude Cowork 火了,基于本地的 AI Agent 产品突然成为大家关注的重点。
扣子2.0,今天正式上线。 2024年2月1日,「扣子」第一次和你见面。我们怀着对 AI 能力的憧憬,在扣子里不断拖拽工作流节点、反复优化提示词,只为真的能把活儿交给AI。 直到今天,扣子已经陪你走过了七百多个日夜,拥有了上千万的用户。
今天是一期硬核的话题讨论: Coding Agent 评测。 AI 编程能力进步飞速,在国外御三家和国产中厂四杰的努力下,AI 编程基准 SWE-bench 的分数从年初的 30% 硬生生拉到了年底的
我们对 Coding Agent 的评测,可能搞错了方向。 一个反复出现,但常常被忽略的现象是:用户对 Agent 的不满,往往不是因为它「做不到」,而是因为它「做得不好」。 「做得不好」集中表现在:
在 Claude 推出 Cowork 功能后,一个明显的信号 —— Agent 不仅仅是辅助工具,而是一种可以被设计、被组织、被反复调用的协作单元。
1 月 15 日上午,千问又前进了一大步,已经准备让智能体全面接管我们的日常生活了。千问 App 上线了全新 AI Agent 能力「任务助理」,同时全面打通阿里生态,一次开启了 400 多项新功能,邀请测试与灰度上线已经同步开启,全都是免费可用的。